热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

ICCV2019|可变形曲面跟踪,亮风台新出基于图匹配的方法

点击我爱计算机视觉标星,更快获取CVML新技术今天跟大家分享一篇ICCV2019跟踪的论文:DeformableSurfaceTrackingbyGra

点击我爱计算机视觉标星,更快获取CVML新技术


今天跟大家分享一篇ICCV 2019 跟踪的论文:Deformable Surface Tracking by Graph Matching,国内AR(增强现实)公司亮风台提出使用基于图匹配的可变形表面跟踪算法,能够充分探索可变形表面的结构信息,显著提高跟踪性能。

该文作者信息:

作者来自亮风台公司、北京交通大学、Stony Brook University。

所提出的方法通过图结构之间的成对投影误差解决了特征对应和形状恢复问题,并采用软匹配松弛来提高计算效率。

与现有先进算法进行广泛比较后,实验结果表明,新方法可以对不同类型纹理的曲面实现稳健的跟踪结果,并且在跟踪精度和计算效率方面一般优于其它算法。

新提出的基于图的可变形表面目标的跟踪算法,主要贡献在三个方面:

  1. 通过软匹配松弛和精心设计的候选匹配滤波策略,将图模型和图匹配引入到可变形表面跟踪中; 

  2. 设计统一的优化框架,探索局部外观,空间关系和变形模型的全部信息,以获得准确的形状重建; 

  3. 构造了一个带有注释的新的真实世界数据集,用于在不同类型的纹理的情景中评估可变形表面跟踪算法。 

以下为论文的详解:

1. 综述

该文解决了跟踪具有已知初始3D形状(即模板)的通用可变形表面目标以及在单眼透视投影下在视频序列中恢复其3D形状的问题。模板可以被提前手动提供,或者使用从运动中恢复形状的方法从视频序列的数帧中计算模板。

与通常分别处理特征对应关系,去除异常值和形状重建的传统方法不同,该文将这些过程集成到一个统一的基于图的框架中,并提出迭代地解决求解对应关系和求解变形的优化问题。

考虑到计算效率,该文将传统图匹配问题中的强匹配约束放宽到松匹配约束。这种松匹配约束使该算法能够保持更多匹配细节,从而产生更精确的形状,并且通过在软匹配约束下开发的新颖匹配算法也极大地提高了计算效率。

伴随着精心设计的候选匹配过滤策略,该文的基于图的方法能够在几秒内处理数千个点,这比传统的基于图的算法快得多。

为了进行全面评估,该文将提出的方法与几个最近提出的方法在两个数据集上进行比较:

一个是提供的跟踪存在遮挡的表面(TSO)基准,包括存在目标被遮挡现象的两个视频序列;

另一个是新收集的数据集,包括使用不同表面在显著形变的条件下记录的11个视频序列,其中这些目标具有丰富,不明显或重复的纹理。 

实验结果表明,该文的方法可以为所有视频序列提供最佳或近乎最佳的跟踪结果。在计算效率方面,该文的方法在两个数据集上的表现也通常优于参与比较的算法。

(CV君:由于微信不支持公式插入,故以下内容使用图片展示)

4. 实验

4.1. 新收集的数据集

最近,几个数据集被提供来用于评估可变形表面目标的跟踪。但是,它们中的大多数缺少带注释的真实结果(groundtruth)网格顶点。

而且,这些数据集是使用非常有限的表面类型的目标收集的,不足以评估可变形表面目标跟踪算法的有效性。

为了全面评估所提出的算法与基准算法的比较,该文创建了一个新的数据集用于可变形表面跟踪,称为可变形表面跟踪(DeSurT)。

使用Kinect相机收集此数据集,以评估各种变形和不同光照条件下的跟踪性能。它包含11个视频流和3,361个帧,显示几种不同类型表面的各种变形,包括七种不同内容的打印图像(分别是校园,砖,布,鹅卵石,景色,石头和日落),两个报纸和两个靠垫。

如图所示,这些表面大致分为三类:

(1)纹理良好的表面,包括校园,鹅卵石,景色,报纸1,报纸2和坐垫1;

(2)重复纹理表面,包括砖,布和垫子2;

(3)弱纹理表面,包括石头和日落。

 

为了评估重建精度,该文使用Kinect点云来构建真实网格,并计算从重建网格到真实网格中顶点到顶点的平均距离

因此,除了每个帧的深度信息之外,所有视频都在每帧中有手动标注的真实网格顶点(打印图片和报纸中使用130个顶点标注,坐垫用121个顶点标注)。

为了测试所提出的算法对遮挡的鲁棒性,该文还报告了算法在公共数据集(跟踪具有遮挡的表面(TSO)上的跟踪结果,这个数据集包括两个分别有着纹理良好和纹理不良的可变形表面目标的视频流,总共394个帧,并且数据集中存在人为和现实的遮挡。

4.2 结果比较与分析

在本节中,该文报告了所提算法与几种最先进的基线算法的比较结果,包括DIR,LM和LLS:

LM采用SIFT匹配进行特征对应,然后进行迭代异常值拒绝步骤,然后通过求解线性系统重建形状,该线性系统是使用扩展的拉普拉斯形式从退化的线性系统转换而来。

LLS仅关注形状重建步骤,并将关键点对应关系作为输入。在该文的实验中,(在异常值拒绝之后)使用从LM派生的关键点对应作为LLS的输入。

DIR是一种基于像素的方法,采用密集模板对齐进行形状重建。它在很大程度上取决于形状的初始估计,该文将其初始化为上一帧的解。

文中固定并分别公布了N=1000和N=2000两组实验结果。

1. 平均跟踪误差(mm)

2. 平均计算时间(s)

如表1所示,该文的算法对于具有丰富,弱或重复纹理的不同类型的表面是鲁棒的,并且即使在从每个表面提取相对较少的关键点(N=1000)以构建对应关系时也显着地优于所有基线算法。

对于遮挡表面(TSO数据集),DIR在精心设计的遮挡检测策略的帮助下实现了最佳跟踪结果。

有趣的是,在没有任何指定的遮挡表面过程的情况下,该文的算法在TSO数据集上达到了与DIR相当的结果,并且一般优于LM和LLS。当将N上升到2000时,该文的算法的跟踪精度在两个数据集上都得到了显着的改善。

考虑到计算时间(表2),DIR在两个数据集上都是最耗时的。该文的算法在N=1000时在两个数据集上击败其他算法。

当将关键点的数量增加到2000时,在TSO数据集上仍然是最有效的,但在DeSurT数据集上比LM慢。

图3至图6表明了由被比较算法提供的各种类型表面跟踪的几个代表性样本。对于结构良好的表面(图3),所有算法都能够提供合理的跟踪结果,但该文的算法可以更好地处理细节。

如图4和图5所示,所有比较的基线算法都受到弱纹理和重复纹理化表面的影响,但该文的算法能够在帧间提供准确的跟踪结果。

此外,该文算法以及DIR对于遮挡是稳健的(图6),而LM和LLS在存在一定程度的遮挡时可能无法跟踪到对象。

 

论文地址:

https://www3.cs.stonybrook.edu/~hling/publication/deformable%20surface-19.pdf 


数据链接:

https://www3.cs.stonybrook.edu/~hling/data/DeSurT.rar (~2G)

因为之前工作相关,对亮风台这家公司还是比较了解的。亮风台是国内为数不多的持续深耕AR底层技术的公司,之前52CV也报道过他们的技术。

他们围绕AR开源了不少算法:包括图匹配算法(PAMI 2018a),2D AR跟踪算法(PAMI 2018b),投影补偿算法(CVPR 2019),单目标跟踪算法(ICCV 2017、CVPR2019)等等。

相信研究跟踪的同学肯定也了解一些他们曾经发布的数据集,TC-128,POT-210,LaSOT。其中TC-128是国际上第一个彩色跟踪评测集,POT-128是目前国际上最大的AR跟踪数据评测集,LaSOT是目前国际上最大的单目标跟踪评测集。


视觉跟踪交流群

关注最新最前沿的目标跟踪、AR跟踪、曲面跟踪技术,扫码添加CV君拉你入群,(如已为CV君其他账号好友请直接私信)

(请务必注明:跟踪)

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉



推荐阅读
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 生成对抗式网络GAN及其衍生CGAN、DCGAN、WGAN、LSGAN、BEGAN介绍
    一、GAN原理介绍学习GAN的第一篇论文当然由是IanGoodfellow于2014年发表的GenerativeAdversarialNetworks(论文下载链接arxiv:[h ... [详细]
  • 计算成像的原理与应用研究
    本文探讨了计算成像的原理与应用研究。首先介绍了小孔成像实验和软件方面的相关内容。随后从傅里叶光学的角度简单谈了成像的过程。成像是观测样品分布的一种方法,通过成像系统接收光的强度来呈现图像。视网膜作为接收端接收到的图像实际上是由像元组成的矩阵,每个元素代表相应位置像元接收光的强度。大脑通过对图像的分析,得出一系列信息,如识别物体、判断距离等。计算成像是一种采集记录系统,通过处理数据得到样品分布与像的对应关系,用于后续问题的分析。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 本文详细解析了JavaScript中相称性推断的知识点,包括严厉相称和宽松相称的区别,以及范例转换的规则。针对不同类型的范例值,如差别范例值、统一类的原始范例值和统一类的复合范例值,都给出了具体的比较方法。对于宽松相称的情况,也解释了原始范例值和对象之间的比较规则。通过本文的学习,读者可以更好地理解JavaScript中相称性推断的概念和应用。 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 【Windows】实现微信双开或多开的方法及步骤详解
    本文介绍了在Windows系统下实现微信双开或多开的方法,通过安装微信电脑版、复制微信程序启动路径、修改文本文件为bat文件等步骤,实现同时登录两个或多个微信的效果。相比于使用虚拟机的方法,本方法更简单易行,适用于任何电脑,并且不会消耗过多系统资源。详细步骤和原理解释请参考本文内容。 ... [详细]
  • JavaScript设计模式之策略模式(Strategy Pattern)的优势及应用
    本文介绍了JavaScript设计模式之策略模式(Strategy Pattern)的定义和优势,策略模式可以避免代码中的多重判断条件,体现了开放-封闭原则。同时,策略模式的应用可以使系统的算法重复利用,避免复制粘贴。然而,策略模式也会增加策略类的数量,违反最少知识原则,需要了解各种策略类才能更好地应用于业务中。本文还以员工年终奖的计算为例,说明了策略模式的应用场景和实现方式。 ... [详细]
  • flowable工作流 流程变量_信也科技工作流平台的技术实践
    1背景随着公司业务发展及内部业务流程诉求的增长,目前信息化系统不能够很好满足期望,主要体现如下:目前OA流程引擎无法满足企业特定业务流程需求,且移动端体 ... [详细]
  • 词袋模型的通俗介绍
    词,袋, ... [详细]
  • 从高级程序员到CTO的4次能力跃迁!如何选择适合的技术负责人?
    本文讲解了从高级程序员到CTO的4次能力跃迁,以及如何选择适合的技术负责人。在初创期、发展期、成熟期的每个阶段,创业公司需要不同级别的技术负责人来实现复杂功能、解决技术难题、提高交付效率和质量。高级程序员的职责是实现复杂功能、编写核心代码、处理线上bug、解决技术难题。而技术经理则需要提高交付效率和质量。 ... [详细]
author-avatar
此号我已不再用
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有